查看原文
其他

研究成果 | 陈昌凤 袁雨晴:社交机器人的“计算宣传”特征和模式研究——以中国新冠疫苗的议题参与为例

陈昌凤 袁雨晴 清华计算社会科学与国家治理
2024-09-19


作者陈昌凤 袁雨晴


【摘要】以社交机器人为代表的“计算宣传”加剧了新冠“信息疫情”中媒介生态的复杂性。本文在人机传播的理论视域下,运用自然语言处理、数据挖掘与分析的方法,研究社交机器人对中国新冠疫苗的议题参与问题,以国际社交平台推特上相关议题的内容为对象,分析其内容特征、形象管理策略以及与人类的互动特征,进而研究社交机器人的参与模式,从而展示其参与“计算宣传”的理念、特征。研究发现社交机器人的议题参与呈现三大特征,分别是内容的聚焦性与负面性、形象的理性化与中立化以及社交的活跃性与广泛性,在立体化的参与模型中,社交机器人实现了从静态单向的传播渠道到动态互动的传播者的转型。研究中还发现参与中国新冠疫苗议题的主要高分账号并不在美国而在印度,疫苗的话题建构多基于财经与社会领域。这些“计算宣传”的新型特征及其背后的观念值得进一步深入研究。


【关键词】社交机器人 计算宣传 计算传播 人机传播 新冠疫苗

------------------------

基金项目:国家社科基金重大项目“智能时代的信息价值观引领研究”(编号:18ZDA307);清华大学国强研究院“社交机器人对中国国际形象建构及效果建模研究”成果。


据 Worldometer 统计,截至北京时间 10 月 10 日 6 时 30 分左右,全球累计确诊新冠肺炎病例超过2.38亿例,累计死亡病例 486 万例。疫情蔓延带来了“信息疫情”(Infodemic)。“信息疫情”一词最早出现于“非典”疫情期间,描述了一种现象——即突发性、真假混杂的疫情信息快速、海量地传播,让惊恐、焦虑中的人们不加分辨地接受、传播,并更加恐慌。“信息疫情”干扰了疫情防护和治理。世卫组织和联合国呼吁社交媒体用户要警惕“信息疫情”,认为其加剧了疫情蔓延与传播的风险。与此同时,计算宣传”(Computational Propaganda)又加剧了疫情中媒介生态的复杂性。2020 年的一项统计指出:全球有超过 81个国家在社交媒体上进行“计算宣传”与传播政治错误信息(Institute, 2020)。其中,大量“计算宣传”出自社交机器人。有研究显示,2016 年美国大选期间,推特上有超过60%的在线流量由机器人产生,对社交媒体上的议题参与和舆论走向产生了影响(罗昕, 2020);社交机器人介入舆论操纵,在推特上,与中国相关的推文中有超过五分之一疑似由机器人用户发布(师文、陈昌凤,2020a);在新冠疫情流行各个阶段,社交机器人试图干预公众对疫情的认知,推特上11.63%与疫情相关的内容由社交机器人发布(师文、陈昌凤,2020c)。


为应对疫情,世界多国积极研发新型冠状病毒疫苗,2020年7月22日我国正式启动新冠疫苗的紧急使用,同年 12 月 15日国家针对重点人群开展了比较大规模的接种。国际社交平台上的社交机器人如何介入了中国新冠疫苗议题?呈现出哪些特征?本文将运用数据挖掘与分析的方法,通过推特上社交机器人有关中国疫苗的发表内容、形象管理和社交互动方面的特征分析,研究社交机器人在中国新冠疫苗议题的参与模式。


一、相关讨论和研究的问题


(一)社交机器人、计算传播和新冠疫苗相关研究

社交机器人(Social Bots)可理解为是在社交媒体上通过各种计算机脚本与程序学习模仿人类、操纵舆论的一 些社交媒体账号 (Samuel C.Woolley, 2016)。社交机器人按照功能可以划分为调查机器人、编辑机器人、恶意僵尸网络以及聊天机器人等。目前,对社交机器人的研究主要集中在人机关系和舆论宣传两大方面。计算科学从技术逻辑研究社交机器人的机器属性,社会科学从文化、传播效果、政策法规、伦理规制等角度批判,这两者都将社交机器人看作异类。但是在“人+社交机器人”的融合生态中,需要从共生角度将社交机器人“人格化”(张洪忠, 段泽宁, &韩秀, 2019)。基于技术接受视角,社交机器人在中美特定网民群体眼中呈现差异,中国网民更加乐观,而美国网民的态度相对谨慎(张洪忠, 何康, 段泽宁, & 斗维红, 2021)。人机交互关系中存在刻板印象,有研究建议应将社交机器人看作社会行动者,丰富研究与测量方法,纠正人类偏见(申琦 & 王璐瑜, 2021)。有学者运用控制实验法,通过受试者观看一家主流机器人公司的 4 个在线流行视频后的反馈,发现机器人拟人化的能力可以帮助人们感知心智,而外表能够激发人们对机器人的同情与保护(Küster, Swiderska, & Gunkel,2020)。


社交媒体在舆论中扮演了重要角色。在美国,有研究表明社交媒体上的共和党用户更容易混淆人与机器人,“政治机器人”加剧了政治两极分化的趋势 (Harry Yaojun

Yan)。社交机器人在推特上参与中国议题的传播,其操纵模式呈现分布与互动的特点,即传播内容强化用户接触特定信息,用户交互改变既有信息交互结构(师文 & 陈昌凤, 2020a)。比如,在香港修例风波的媒体议题中,社交机器人在一级传播中的目标比较多元、活跃度高,但在二级传播中的影响力较低(师文& 陈昌凤, 2020b);再比如,在中美贸易谈判议题中,社交机器人主要通过消息推送而非意见领袖的方式影响舆论(张洪忠, 赵蓓, & 石韦颖, 2020)。社交机器人在全球范围内影响深远,有研究提出,社交机器人的治理应当树立“全球治理”的思维,明确用户、社交媒体公司与政府权力之间的关系(Jones, 2019)。


“计算宣传”运用算法、深度伪造、社交机器人和人类策展等多种形式在社交媒体中传递虚假信息或者错误信息,以达到特定宣传目的,兼具较高的技术性与政治性特征(Samuel C. Woolley, 2017)。目前关于“计算宣传”的研究主要集中在概念界定、技术原理、新旧宣传方式对比、应用现状、影响分析以及应对策略等方面。“计算宣传”作为一种隐蔽的说服方式,通过计算目标受众、传播内容以及传播路径实现精准传播(欧亚 & 夏玥, 2019);其核心是运用算法技术,特征是隐蔽性、精准化与自动化,而“信息疫情”中的“计算宣传”具有鲜明的政治化特征(史安斌 & 杨晨晞, 2021)。


“计算宣传”使得宣传向个性化发展。有学者运用自然语言处理与网络分析的方法,结合 TSHP-17 的数据集进行分析,发现“计算宣传”利用互联网的匿名性、社会网络的微观分析能力以及易于自动创建和管理的账户网络,可以对数百万级的用户进行个性化的定向宣传 (Martino etal., 2020)。“计算宣传”是公共舆论在人工智能时代下的一种新形态,其目的在于制造同意,通过产生虚假民主、两极分化来扰乱公共领域,分裂社会共识(罗昕, 2020)。


国内对社交机器人在新冠疫情期间议题建构中的实证研究较为缺乏。此外,关于疫苗接种的研究,目前主要着眼于我国各地区接种意愿与影响因素的研究,而对接种注意事项与疫苗犹豫的应对策略的研究,学界主要是从地区性和线下的视角出发,缺乏计算传播视角和国际性的、线上视角对社交媒体内容的分析,本文主要从这两方面进行研究。


(二)人机传播框架和研究问题

随着智能语音、聊天机器人、虚拟现实、自动化新闻写作、自然语言处理、深度学习等技术与应用的飞速发展,人机交互逐渐深入。人机传播(Human-Machine Communication,HMC)是近年来新兴的一个理论框架,研究人类与机器之间的交互与沟通,以及其对社会的影响。该理论主要有以下三个研究取向(Guzman & Lewis, 2019):一是从功能层面研究人们如何利用机器设备与应用。Bot(Robot的缩写)是 20 世纪捷克的一个术语,意思是“强迫劳动”或者“奴隶”。这一含义反映出人们对机器的一种工具性、客体性的认识论。这一层面的理论主要包括 TRA 模型、UTAUT模型、TAM模型等技术接受理论。二是从关系层面研究人们如何与技术联系。媒介等同理论(Media Equation)认为人们会将机器人格化,视其为具有社会属性的“人”,并根据机器产生的一系列社会化线索(比如文字、图像、语音、视频)等与其互动,产生社会化的反应。HMC 理论认为机器在传播中的角色应当从渠道转变为信源,机器的行为应当从静止的变为互动的。机器不再是中介者,而是传播者(Lewis, Guz-man, & Schmidt, 2019)。三是从本体论层面研究人、机器与交流的模糊界限,具有形而上学的意义。拉图尔提出的行动者网络理论(Actor-Network Theory,ANT),将人、机器、传播等都视为去中心化、平等的行动者,它们通过互相转译而建立联系,从而形成一个实时变动的网络(Latour, 2005)。该理论强调了行动者的非人属性与非人主体的能动性,启发人们在趋于技术中介化的后人类社会中,重新审视人与技术的本体论关系。


上面三个研究层次在人机关系的本体论上趋于灵活,机器的能动性逐渐增强。然而,第一个层次过于有工具理性倾向,不利于发掘机器的智能化;第三个层次过于有去人文主义倾向,缺乏约束机器的伦理性。因此,本研究主要采纳第二个层次的关系层面的理论,将社交机器人视为是社交媒体上具有人格属性的、与人类用户进行积极互动的角色主体。


综合研究现状与理论框架,我们提出本文的主要研究问题:

问题1:社交机器人在推特上对中国新冠疫苗的内容发表上有何特征?

问题2:社交机器人在推特上对中国新冠疫苗的形象管理有何特征?

问题3:社交机器人在推特上对中国新冠疫苗的社交互动有何特征?


本文的研究路径图如图1所示。在人机传播理论框架中,本研究采用第二层级的关系取向,即将社交机器人看作和人类互动的信源者与传播者,并从三个维度进行操作;在“内容发表”方面,本文涵盖推文的话题导向、情感态度和语义网络;在“形象管理”方面,本文涵盖用户的自我介绍、账号性质、图像昵称、分布地区;在“社交互动”方面,本文涵盖互动行为与粉丝数量。


图1 理论框架与概念操作路径图


二、研究设计与过程


(一)数据抓取

本研究围绕重要时间节点抓取研究样本。由于新冠疫苗接种的时段较长,本研究梳理了相关时间线,结合主流媒体报道,确定了以下4个重要的时间节点(见表1),考虑到事件传播的时延性,将每个时间点以3天为1个周期。


表1 新冠疫苗接种的重要时间节点


在推特上搜索关键词“Covid-19 Vaccine”“China” 与“coronavirus vaccinations”“China”(有的用户使用缩写,有的用户使用全称),并将这两种搜索结果都包含在内。本研究采用了Python中snscrape库进行数据抓取,该库允许人们在不受Tweepy限制的情况下抓取推文。抓取字段包括用户名(user-name)、个人主页(url)、发表日期(date)、发表内容(content)、回复数量(reply_count)、转发数量(retweet_count)、点 赞 数(like_count)、引 用 数 量(quote_count)、粉丝数量(follower_count)等,然后结合数据抓取字段来修改代码并抓取相关数据。

(二)账号检测

本研究采用了 Botometer(Botometer 是由美国印第安纳州大学社交媒体观察站 OSoMe 和网络科学研究所 IUNI 研发的项目)对推特上的账户进行社交机器人身份检测。它是一个经过训练的机器学习算法,通过标记数万个示例账号来提取一千多个特征用以表征账户的个人资料、朋友、社交网络结构、时间活动模式、语言以及情绪等信息。当检查一个账户时,Botometer 会调用推特的 API 获取该账户的公开资料,并传送到 Botometer API中,将1个账户与数万个已经标记的账号进行比较后再进行打分(如图2所示),该系统的分数测评为5分制。用户需要将自己的推特账号授权给Botometer,通过手动输入检测账号,获得分数。分数越高,说明该账号的机器人活动的可能性越大。分值为“0”表示最像人类,分值为“5”表示最像社交机器人。一般当分数大于或等于“3”时,则该账号就被判定为高度疑似“社交机器人账号”(下文简称“社交机器人”)(张洪忠et al., 2020)。Botometer 设定了机器人的类型分数,通过打分来显示其特征。目前有代表性的社交机器人有以下6种类型:


图2 Botometer检测结果图


①回声室(Echo-chamber):参与跟踪群组并大量共享和删除政治内容的账户;

②假追随者(Fake follower):购买机器人以增加追随者数量;

③金融(Financial):使用现金标签发帖的机器人;

④自我声明(Self declared):来自botwiki.org的机器人;

⑤垃圾邮件发送者(Spammer):来自多个数据集的标记为垃圾邮件机器人的账户;

⑥其他:从人工标注、用户反馈等中获得其他类型的机器人。

(三)研究方法与数据分析

1.描述性分析

本研究共抓取到推文数 2935个,针对同一用户在短时间内发布的同一内容进行去重后得到推文数2930 个,由于有 3 个账号检测不到,因此在已有的2927个账号中,社交机器人账号(score≥3)的数量为1695 个,占 57.91%。可见在中国新冠疫苗接种议题的参与主体的分布上,社交机器人占比较大。所有账号分数检测分布情况如图3所示,平均数为 2.88,中位数为 3.5,众数为4.4。账号的平均水平靠近上四分位数,分布不均衡,有极化趋势。


图3 推特帐号分数检测分布箱型图


2.对“内容发表”的分析

运用自然语言处理(Natural Language Processing,NLP),我们对社交机器人发布的推文内容进行以下分析:


(1)话题聚焦

本研究拟采用 LDA(Latent Dirichlet Allocation)模型进行“主题聚类”。LDA 是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。


该模型假设一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定的概率选择某个词语”这样一个过程得到的。LDA 运用词袋模型:即“词+权重”(编号+权重)。LDA 对每一篇文档,从主题分布中抽一个主题,从上述被抽到的主题对应的单词分布中再抽一个单词,重复上述过程直至遍历文档中的每个词(如图4所示)。


图4 主题聚类路线图


我们分别设置 Topic number=10、15、20、25、30,并 对1695 个社交机器人账号发布的内容进行主题聚类后,结果发现相关话题包括紧急接种、疫苗厂商、国外市场、疫苗有效性与疫苗实验等五大类(如表 2)。结合高频词发现,对疫苗厂商的关注成为焦点(详见图5)。其中,国药(Sinopharm)的词频为577,关注度最高,这与它在 2021年 5 月 7 日获得世界卫生组织紧急使用认证的事件相关。中国科兴疫苗(Sinovac Biotech)位列第四。


表2 推特社交机器人发布内容的主题聚类结果


图5 疫苗厂商词频统计条形图


本文分别对人类和社交机器人账号的发布内容进行文本分类(如图6所示),人类发布的内容主要集中在健康(占 25.41%)与教育领域(占24.59%),各领域话题分布较为均衡。而社交机器人的内容则出现了极端分布的 特征,财经领域占到了84.52%,其次是社会领域,占到了9.72%。而健康议题仅占比 3.36%。


图6 人类与社交机器人发布内容文本分类


上面的数据分析表明,推特社交机器人发布的内容中健康议题的占比远低于财经与社会议题,社交机器人更多在疫苗接种问题上强调其带来的财经与社会危机,并以此为切入点,延伸扩大到中美关系的紧张和意识形态的对立,肆意渲染中国疫苗接种的负面影响。


(2)情感态度

我们采用了清博 AI 实验室中的 NLP 工具,分别对人类账户和社交机器人账户发布的内容进行情感分析(Sentiment Analysis),比较两者之间的情感差异(如图7所示)。结果发现,社交机器人发布的内容中的负面情绪占比为28.75%,显著高于人类的 8.25%。结合对账号具体发布的内容分析后我们发现,绝大多数社交机器人发布的内容中全都带有明显的诋毁中国、污名化中国、乱贴标签等非理性的内容,这些内容极度渲染推特上对中国新冠疫苗的负面情绪。后真相时代,社交机器人将新冠疫苗变成了一种符号化的“武器”,在社交媒体冷战中故意制造冲突与矛盾,激发用户的负面极端情绪,加剧了群体极化与价值分裂,不利于全世界协同抗疫。


图7 推特上人类与社交机器人发布内容情感属性分布图


(3)语义网络

语义网络分析(Semantic Network Analysis)产生于认知心理学领域,是基于机器学习的人工智能技术,是一种根据词语的出现频率、共现距离等呈现语义关系的内容分析法。语义网络分析的过程如下:如果两个语词同时出现在一定“共现距离”的文本内(由研究者设定共现距离的长度),则两者之间有一条连边关系。此外,还可以根据语词的词频(TF-IDF 值),构建加权语词共现网络。学者认为,基于语词网络的分析过程结合了文本挖掘与网络分析,是计算传播学对于传播内容分析的重要发展方向(张伦, 2018)。


本研究运用 Ucinet NetDraw (版本号 2.141)软件分别对推特上人类和社交机器人发布的内容进行语义网络分析。首先提取高频词,导入一行一句的未分词文本文件(ANSCII 编码格式),通过分词计算产生高频词表;其次,过滤无意义词,结合已有设定的过滤词表,产生过滤后的有效词表;再次,提取行特征,产生行特征词表;最后,根据“共现矩阵”词表构建语义网络(如图8、图9)。


图8 人类账号发布内容语义网络图


图9 机器人账号发布内容语义网络图


本文对两个网络进行K-cores分析。K-cores 算法是用于找出网络图中指定核心密度关联的子图结构的算法。K 值表示每个顶点至少与该子图中的 K 个其他节点相连,用来判断核心节点以及节点之间的紧密程度。人类语义网络图中的 K 值最大为9,变 化 幅 度 为1-2-3-4-5-6-8-9,连续性较强;而社交机器人语义网络图中的 K值最大为10,变化幅度为1-2-3-5-9-10,连续性较弱。


“度中心性”(Degree Centrality)是指网络中节点与其他节点直接相连的程度。“度中心性”越高,说明该节点在网络中的中心性越高;“度中心性”越低,说明该节点在网络中越处于孤立地位。对于机器人网络而言,当 degree=5 时,图中有 10 个节点没有直接相连,处于孤立状态。对于人类网络而言,当 degree=5时,图中有还有节点存在连边关系,而且只有6个节点没有直接相连,处于孤立状态。


由此可见,人类的语义网络相对分散平均,各级话题间的互动频繁,孤立节点较少,呈现连贯交叉的话题讨论网络。而社交机器人的语义网络相对聚焦极化,各级话题之间的互动零散且孤立节点较多,呈现断裂集群的话题讨论网络。社交机器人的话题呈现了有目的性的宣传输出。


再聚焦到“假冒”语词的共现强度,发现在人类社交账号的语义网络中,“假冒”一词与“中国”和“疫苗 ”的 共 现 次 数 分 别 为“97”与“101”;但是在社交机器人的语义网络中,“假冒”一词与“中国”和“疫苗 ”的共现次数分别 为“138”与“138”(如图 10 所示)。结合连边指向,可见,推特上的社交机器人更多地有意将“假冒”与“中国疫苗”进行语义联想。


图10 人类与社交机器人有关“假冒”一词的共现强度


综上,在内容发表层面,与人类账号发表的内容相比,社交机器人的话题导向方面聚集财经领域,情感态度上负面占比较大,出现极端化、情绪化的言辞宣泄;语义网络呈现断裂集群、目的性的宣传输出特征。


3.对“形象管理”的分析

在 score=5 的账号中,经过去重(N=67)后,我们分析了社交机器人账号“形象管理”的特征。在头像方面,大多数头像都是机构的logo,体现出一定的组织化与“权威性”,但有3个用户的头像没有进行设置,属于系统默认的空白状态。仅有8个账号为拟人化的头像,而且全部为男性,体现了理性的特征;有 1 人戴着墨镜,1 人面戴口罩,多以正面头部肖像或者上半身的形象为主,想体现较强真实感。在非个人账号的头像上,除了机构 logo 外,头像也有 以 下 几 种 :1 个 用 户 名 为“THE AUTHORITY”,是尼日利亚的一份日报,其头像是一个法官所用的法槌;用户名为“News Unlocked”的头像是一把解开的锁,意味着解密的定位。特别的是,用户名为“Coronavirus”的头像就是新冠病毒的图像,账号定位也是专门发布有关新冠病毒的相关内容。


在账号的性质方面,明确了是组织机构的有 42 个,而且多以世界各地的新闻媒体或者新闻聚合平台的 组 织 形象出现,例如 24 NewsHD、FIVEamNEWS、 newsafricanow、TheTop10News2 等。个人账号为8个,这8个中有明确身份的是 1 位菲律宾的新闻记者、1 位医生、1 个联盟营销人员与运营总监,多体现了职业定位的属性。未明确身份主体的有 18 个。在国别方面(如图 11),结合账号的定位以及个人介绍进行分析后发现,除 23 个账号没有明确标明所在国家外,我们发现账号的分布多集中在印度、美国与尼日利亚等3个国家。在账号个人资料介绍方面,都提到是以提供“客观”的最新消息为宗旨,比如“24 News HD”(score=5,followers=822342)声称是巴基斯坦第一个时事新闻频道,并声称“每一句话都值得信赖”;而“Digitaltariq”(score=5,followers=30)是印度最新的平台,致 力 于 提 供 有 关 技 术 的 文 章 ;“Worldnwsdotcom”(score=5,followers=62)声称每 3 分钟就给读者带来世界上最新的消息!


图11 推特账号(score=5)的国家地区分布柱状图


综合来看,社交机器人的“形象管理”在表面上看来都想呈现“客观”“理性”“中立”的特点,多以机构化的身份发布最新消息,以此来证明所发布内容的可信度与权威性。


4.对“社交互动”的分析

本研究对人类账号和社交机器人账号的回复、转发、喜欢、引用等社交互动行为的数量与占比进行了分析(如表3),人类账号行为活跃度的排序为:回复>喜欢>转发>引用;机器人账号行为活跃度排序为:喜欢>转发>回复>引用。我们发现,社交机器人更倾向于通过喜欢的方式参与互动,行为成本更低,而且容易获得情感支持和社交资本,体现了“追随者”的角色定位。从互动种类的覆盖率来说,社交机器人为 8.7%,人类为6.1%,可见社交机器人比人类更加活跃。


表3 人类与社交机器人社交行为分析


为验证上述差异是否显著,本研究对人类账号与社交机器人账号的回复、转发、喜欢、引用等社交互动行为以及粉丝数量进行了“独立样本t检验”(详见表4)。结果发现,人类账号与社交机器人账号在社交行为上不存在显著差异,但是在粉丝数量上的差异是显著的。再运用 Logistic 回归模型进一步分析(如表5),p值为0.000,我们发现粉丝数量确实是影响人类账号与社交机器人账号区别的一个重要因素。


表4 人类与社交机器人社交互动独立样本t检验(NHuman=1232,NRobot=1695)


表5 影响人类账号与社交机器人账号因素的logistic回归分析


因此,本研究进一步比较了人类账号与社交机器人账号的粉丝特征(如图12、图13)。发现社交机器人账号在1万以上的粉丝数量的比重高于人类,因此其在推特上发表意见覆盖的范围更广、影响力更大。


图12 推特社交机器人与人类账号粉丝数量对比柱状图


图13 推特社交机器人与人类账号粉丝数量占比饼图


综上所述,虽然社交机器人账号与人类账号在社交互动行为方面的差异性较小,且前者更多体现了“追随者”的角色,但是社交机器人账号在粉丝数量方面远高于人类账号,所以其实现了传播影响力的规模化覆盖。


三、结论与讨论


本研究在人机传播的理论框架下,抓取了推特上关于“中国新冠疫苗接种”的 4个重要时间段内的推文内容,对账号进行社交机器人检测后,研究了其在内容发表、

形象管理与社交互动等方面的议题参与特征,从而呈现出了社交机器人卷入“计算宣传”的典型特征情况。


我们认为,在本次“中国新冠疫苗接种”的议题中,依托推特这个社交媒体平台,社交机器人不仅仅是一个单向的内容输出渠道和传播中介,而且还构建出了立体化的三维参与模型(如图14):社交机器人发布内容的聚焦领域体现了其鲜明的指向性并带有一定的负面情感色彩,具有纵向的针对性;在形象管理方面,社交机器人账号具有“中立化”以及“理性化”的外在形象特征;在社交互动方面,相比较人类账号的行为,社交机器人账号的互动种类与活跃度更高且粉丝数量高于人类,实现了横向的传播范围覆盖;在三个维度的相互作用下,社交机器人强化了议题参与和宣传的效果。


图14 社交机器人议题参与特征的三维模型


此外,本研究还有以下新的发现:首先,在得分最高(score=5)的社交机器人账号中,美国并不是主要的账号所在地和推手,反而是印度;其次,社交机器人的互动能力主要体现在社交关系而非内容话题层面,且更多是通过较大的粉丝数量进行传播;再次,机器人对疫苗的话题建构并非以健康传播为核心,而是以财经与社会为切入点。


这些新的结论启发我们在人机传播视域下,重新审视社交机器人的行为活动特征以及“计算宣传”的方式。回溯宣传的历史,从分发纸质小册到一战时期由国家主导的大众传媒带来的“魔弹论”再到如今在互联网的社交平台上通过人工智能与算法实现自动化代理、精准投放以及隐蔽式的社交机器人,“计算宣传”日益渗透进人们的网络生活与交往中,在无形之中影响舆论并参与建构媒介化现实。在国际社交媒体平台进行传播时,应当提高技术手段,加强对社交机器人的识别,针对其议题参与的行为特征,与平台协作,建立“多利益攸关方”的治理模式。


社交机器人以交流互动的传播者角色混淆在人类声音的场域中。然而,正如 Botometer 官网中所提醒的:很少有完全自动化的社交机器人账号,大部分的账号都是由人工和机器共同运行的。因此,一方面,社交机器人内嵌了人类的价值取向,它们是可以帮助人们更快、更准确地获取信息,抑或是来制造信息污染、攻击政治对手、实现政治宣传,这与算法工程师的意图以及背后的权力关系、平台利益等因素密不可分。当我们能识别出社交机器人账号时,便实现了对技术的“祛魅”,但同时也要防止技术带来新的“遮蔽”。齐格蒙特·鲍曼认为技术的中介化遮蔽了道德行为的意义(鲍曼, 2002)。编写代码、不断优化算法的程式化任务为算法工程师遮蔽了社交机器人背后可能带来的不良后果:包括激化地区矛盾冲突与意识形态对立、传播虚假信息加重“信息疫情”、产生虚假民主以及撕裂社会共识等,道德问题似乎成为了一个纯粹理论化、操作化与数学化的命题与概念,这就是社交机器人为相关利益群体带来的“道德催眠药”,以此来逃避自身应当承担的道德责任。另一方面,无监督式的算法设计赋予了社交机器人“自进化”的能力,它们通过在社交媒体平台上自主学习语料,不断进行自我迭代。兰登·温纳在《自主性技术》中提到了“技术漂迁”的概念来指涉技术的复杂性。能够自我生成、自我维持和自我规制的技术在人类无法预料到的方向上随意“漂迁”,给人类带来了机遇和挑战。当社交机器人的声量占比超过了人类,是否会产生操纵人类行为的可能?正如谷歌前设计道德伦理学家 Tristan Harris所言:“作为工具的东西会忠诚地坐在那里耐心等待;而不是工具的东西便会引诱甚至操纵你,从你的身上获取利益。我们已经走过了以工具为基础的技术环境,目前的技术环境 是以操控为基础的 ( 岸光,2020)。”而正确认识到人类与社交机器人“共生”的辩证关系,有利于人类规避技术风险。


对社交机器人的研究目前尚处于前沿领域,相关理论、方法与路径都还在不断探索之中。本研究的研究样本数据量有限,而基于一个动态训练集的 Botometer 的检测算法的各项指标会随着账号的动态变化而实时变动、并非固化,所以这些技术方面的问题带来了本研究结果的局限性。此外,社交机器人参与“计算宣传”现象背后的宣传观念、算法原理、权力关系以及伦理道德等领域的问题,还有待我们进一步共同研究、不断深化。

①:编者注:该数据对应2021年10月10日全球疫情数据。学术引用请参考原文。






编制| 清华大学计算社会科学与国家治理实验室

转载| 版权归原作者所有,转载请注明出处。

来源| 《新闻与写作》2021年第11期


实验室简介

清华大学计算社会科学与国家治理实验室(LCG-THU)于2021年12月批准成立,实验室挂靠清华大学文科建设处,作为教育部批准建设的全国首批哲学社会科学实验室,是促进文科与理工学科交叉融合的综合支撑平台与创新基地。实验室由副校长彭刚兼任主任,公管学院教授孟庆国任执行主任
微信公众号LCG-THU邮箱号lcg-thu@tsinghua.edu.cn


继续滑动看下一个
清华计算社会科学与国家治理
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存